草庐IT

c++ - MBCS 到 UTF-8 C++

全部标签

c - 使用 libxml 获取节点的所有属性列表

我很难找到一种方法来提取节点所有属性的列表,而不知道它们的名称。我正在使用以下方法提取单个已知属性:xmlGetProp(cur,(constxmlChar*)"nodename")但是如何使用libxml2获取所有属性的列表?问候,马吕斯 最佳答案 简单地遍历节点的属性列表,即:xmlNodePtrNode=...;for(xmlAttrPtrattr=Node->properties;NULL!=attr;attr=attr->next){...dosomethingwithattr......thenameoftheattri

c# - 在 C# (.Net 3.5) 中,是否可以使用标准文字常量来代替 "utf-8"?

我想找到一个更好的方法来做到这一点:XmlNodenodeXML=xmlDoc.AppendChild(xmlDoc.CreateXmlDeclaration("1.0","utf-8",String.Empty));我不想在键入代码时考虑“utf-8”与“UTF-8”与“UTF8”与“utf8”。我想让我的代码更不容易出现拼写错误。我确信某些标准库已将"utf-8"声明为const/readonly字符串。我怎样才能找到它?另外,“1.0”呢?我假设主要的XML版本也已在某处枚举。谢谢! 最佳答案 试试Encoding.UTF8.

python - Unicode解码错误: 'utf-8' codec can't decode byte 0xe2 in position 434852: invalid continuation byte

我正在使用hfcca计算C++代码的圈复杂度。hfcca是一个简单的python脚本(https://code.google.com/p/headerfile-free-cyclomatic-complexity-analyzer/)。当我尝试运行脚本以生成xml文件形式的输出时,出现以下错误:Traceback(mostrecentcalllast):"./hfcca.py",line802,inmain(sys.argv[1:])File"./hfcca.py",line798,inmainprint(xml_output([fforfinr],options))File"./hf

c# - XmlWriter 在 C# 中使用 StringWriter 编码 UTF-8

我正在使用C#输出一个xml文件,我试图将xml编码值设置为UTF-8,但它当前输出的是:这是我的代码:publicsealedclassStringWriterWithEncoding:StringWriter{privatereadonlyEncodingencoding;publicStringWriterWithEncoding(Encodingencoding){this.encoding=encoding;}publicoverrideEncodingEncoding{get{returnencoding;}}}privatestringGetXml(JobStorejob

xml - XML 中的 UTF-8 或 ISO-8859-1

我们有一个应用程序,它将用户输入的文本字符串输入到Web表单中,并将其打包为XML。只是为了稍微混淆一下,XML作为Outlook电子邮件消息的正文发送。因为用户几乎可以将任何内容粘贴到Web表单中(通常来自Word),文本字符串可以包含非ASCII(7位)字符,例如用于左双引号和右双引号的字符。该字符串通过电子邮件原封不动地传输,但是当我们使用MicrosoftXML解析器时,它会(非常正确地)提示XML包含无效字符。快速修复是将encoding="iso-8859-1"放在header中。但是,我想知道一开始就以真正的UTF-8格式对XML文件进行编码是否会更好,因为我读过的文章指

c - 如何将 XML 文件读入 C 中的缓冲区?

我想使用C将XML文件读入char*buffer。执行此操作的最佳方法是什么?我应该如何开始? 最佳答案 如果您想解析XML,而不仅仅是将其读入缓冲区(这不是特定于XML的东西,请参阅Christoph和Baget的回答),您可以使用例如libxml2:#include#include#includeintmain(intargc,char**argv){xmlDoc*document;xmlNode*root,*first_child,*node;char*filename;if(argc(%i)\n",root->name,ro

C# XmlWriter 和无效的 UTF8 字符

我们创建了一个单元测试,它使用以下方法生成随机UTF8文本:privatestaticRandom_rand=newRandom(Environment.TickCount);publicstaticbyteCreateByte(){return(byte)_rand.Next(byte.MinValue,byte.MaxValue+1);}publicstaticbyte[]CreateByteArray(intlength){returnRepeat(CreateByte,length).ToArray();}publicstaticstringCreateUtf8String(i

c - 在纯 C 中解析 XML

在纯C中解析XML数据的首选库是什么? 最佳答案 C的规范XML解析库是libxml2. 关于c-在纯C中解析XML,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/4846568/

ruby - Nokogiri 无法使用 UTF-16 声明输出 XML(理解和解决)

总结尝试读取和序列化具有UTF-16编码和声明的XML文档会导致Nokogiri在某个点后产生垃圾。这是一个错误,还是对此有合理的解释?避免它的最佳方法是什么?环境C:\>nokogiri-v#Nokogiri(1.5.5)---warnings:[]nokogiri:1.5.5ruby:version:1.9.3platform:i386-mingw32description:ruby1.9.3p194(2012-04-20)[i386-mingw32]engine:rubylibxml:binding:extensioncompiled:2.7.7loaded:2.7.7详情我有一

xml - readHTMLTable 和 UTF-8 编码

我一般在readHTMLTable和XML包中遇到编码问题。我想从波兰网站allegro.pl(类似于ebay的拍卖网站)下载一些表格,但之后,波兰字体存在编码问题,即使我在中使用encoding="UTF-8"或stringsAsFactors=F读取HTMLTable。代码:library(XML)url结果:>head(alldata[,c(2,3)])V2V31FacebookFanPagezANIMACJĄindywidualnyprojektKupTeraz!150,00zł2Lubięto!Facebook!OKAZJA!!!160FANĂ“W!!!Z